Hacia un razonamiento generalizable: Optimización de políticas contrafactuales causales grupales para el razonamiento de LLM
Explora el razonamiento generalizable con políticas contrafactuales causales grupales para LLM. Una aproximación innovadora para mejorar la equidad y el rendimiento de modelos de lenguaje.